|
ISO/IEC 6937:2001, ''Information technology — Coded graphic character set for text communication — Latin alphabet''(情報技術 — 文字コミュニケーションのためのコード化された図形文字集合 — ラテンアルファベット)は、ISO基本ラテンアルファベットにないラテン文字を表現するためにASCII(ISO/IEC 646)をマルチバイト拡張したものである。ITU-T(当時はCCITT)によってテレマティクスのために開発され、T.51として勧告された。1983年にISO標準となった。 特定のバイトコードが、ダイアクリティカルマークつきの文字のためのバイトとして使われる。第1バイトの値がダイアクリティカルマークの種別を表し、ASCIIの値を持つ第2バイトが、ダイアクリティカルマークがつく文字を表す。第1バイトと第2バイトは特定の組み合わせのみが許容され、第1バイトの解釈は第2バイトによって例外がある。ISO/IEC 6937ではダイアクリティカルマークつきの組み合わせ後の文字は1つもコード化されていない。ダイアクリティカルマークその物を表したい場合は、第2バイトにASCIIのスペースを入れる。 ISO/IEC 6937は、ピーター・フェンウィック、、レーク・ゼッケンドルフによって設計された。 ISO 6937/2ではラテン文字を使用する現代のヨーロッパの言語で使われている327の文字が定義されている。キリル文字・ギリシャ文字などのラテン文字ではない文字は含まれていない。ダイアクリティカルマークつきのラテン文字でも、ルーマニア語のȘ(Sコンマ)など一部は含んでいない。Sコンマについては、規格制定時にコンマビローとセディーユの区別をしていなかったので、コンマビローの代わりにセディーユを使用する。 IANAでは、ISO 6937/2のバージョンの違いに応じて''ISO_6937-2-25''と''ISO_6937-2-add''の2つの名称を与えている。ただし、この文字コードがインターネット上では使用されたことはない。 ISO/IEC 6937の右半分を指すISO/IEC 2022のエスケープシーケンスは ESC - R (十六進数 1B 2D 52 )である〔Supplementary Set of ISO/IEC 6937:1992 The high-ASCII half of the character set. (The left-hand side is U.S. ASCII .)〕。==1バイト文字== ISO 6937/2の基本文字(0x00-0x7f)はISO 646に基づいているが、国際通貨記号(¤)に割り当てられていた0x24をドル記号($)に変更している。
スポンサード リンク
|